Análisis de datos con DPLYR y funciones de resumen

Dr. Oscar V. De la Torre Torres

2024-07-05

Introducción

En este documento se realizará un análisis estadístico y gráfico del precio del arroz cultivado y comercializado en las principales centrales de abasto de México. Esto apra ilustrar el empleo de múltiples funciones de la librería dplyr y librerías de visualización de datos.

Para esto, se itulizaron las siguientes librerías:

Como se puede apreciar, la tabla anterior se realizó con la función datatable que es parte de la librería DT. Este tipo de tabla solo puede utilizarse para presentarse en páginas web, dashboards o documentos html o en línea. No será útil para compilar documentos en word o en pdf. Para ello se utilizan otras librerías.

Empleo de dplyr para análisis de datos

Con los datos anteriores, nos interesa saber cuáles Estados se encuentran registrados en la nase de datos Datos. Para esto, debemos convertir la columna Origen de ser un objeto tipo character a un objeto tipo factor. Este último tipo de objeto es útil para realizar análisis estadísticos y gráficos y encontrar factores o clase (grupos, Estados)

##  [1] "Campeche"         "Chiapas"          "Chihuahua"        "Coahuila"        
##  [5] "Colima"           "Distrito Federal" "Durango"          "Guanajuato"      
##  [9] "Guerrero"         "Importación"      "Jalisco"          "México"          
## [13] "Michoacán"        "Morelos"          "Nacional"         "Nayarit"         
## [17] "Nuevo León"       "Oaxaca"           "Puebla"           "Querétaro"       
## [21] "Quintana Roo"     "San Luis Potosí"  "Sin Especificar"  "Sinaloa"         
## [25] "Sonora"           "Tabasco"          "Tamaulipas"       "Veracruz"        
## [29] "Yucatán"          "Zacatecas"

En nuestro análisis nos interesa solamente los datos del Estado de Michoacán. Para ello generaremos un objeto llamado datosMichoacan que contendrá solamente los datos del Estado de Michoacán.

Repetimos el proceso de filtrado anterior pero ahora utilizaremos la librería dplyr:

Ahora nos interesa filtrar, de manera conjunta, los datos del Estado de Michoacán y de la centras de abastos de Morelia (Destino==“Michoacán: Mercado de Abasto de Morelia”):

Ahora, nos interesa saber cuál es el precio promedio del arroz en México por fecha. Para ello, utilizaremos la función group_by de dplyr con la función summarize:

Gráficas interactivas con plotly

Gráficas por defecto en R

Podemos generar una gráfica simple (y no muy bonita) como la siguiente:

Gráficas interactivas con plotly

Ahora se puede utilizar la librería plotly: